在学习在模拟环境中执行电机任务时,必须允许神经网络探索其动作空间以发现新的潜在可行的解决方案。但是,在具有物理硬件的在线学习场景中,此探索必须受相关的安全考虑因素限制,以避免损坏代理的硬件和环境。我们的目标是通过培训一个神经网络来解决这个问题,我们将参考“安全网络”,以估算受控自主动态系统的吸引力(ROA)。因此,这种安全网络可以用于量化所提出的控制动作的相对安全性,并防止选择破坏性动作。在这里,我们通过培训人工神经网络(ANN)来表示我们的安全网络的发展,以代表几种自主动态系统基准问题的ROA。对该网络的培训是基于Lyapunov理论和神经解的局部微分方程(PDE)的神经解。通过学习近似包含感兴趣系统动态的特殊选择的PDE的粘度解决方案,安全网络学习近似特定函数,类似于Lyapunov函数,其零电平集是ROA的边界。我们培训我们的安全网络,以便在物理信息通知神经网络(PINN)方法的修改版本之后以半监督方式解决这些PDE,利用损失函数,以惩罚与PDE的初始和边界条件的分歧,以及非零残差和变分术语。在未来的工作中,我们打算在电机学习任务期间将这种技术应用于加强学习代理。
translated by 谷歌翻译
Reinforcement learning (RL) operating on attack graphs leveraging cyber terrain principles are used to develop reward and state associated with determination of surveillance detection routes (SDR). This work extends previous efforts on developing RL methods for path analysis within enterprise networks. This work focuses on building SDR where the routes focus on exploring the network services while trying to evade risk. RL is utilized to support the development of these routes by building a reward mechanism that would help in realization of these paths. The RL algorithm is modified to have a novel warm-up phase which decides in the initial exploration which areas of the network are safe to explore based on the rewards and penalty scale factor.
translated by 谷歌翻译
在人类神经科学中,机器学习可以帮助揭示与受试者行为相关的较低维度的神经表现。但是,最新的模型通常需要大型数据集进行训练,因此容易过度拟合人类神经影像学数据,这些数据通常只有很少的样本但很多输入尺寸。在这里,我们利用了这样一个事实,即我们在人类神经科学中寻求的特征恰恰是与受试者行为相关的事实。因此,我们通过分类器增强(Trace)开发了与任务相关的自动编码器,并测试了其与两个严重截断的机器学习数据集的标准自动编码器相比,它提取与行为相关的可分离表示的能力。然后,我们在fMRI数据上评估了两个模型,受试者观察到动物和物体。 Trace几乎单方面优于自动编码器和原始输入,在发现“清洁剂”,与任务相关的表示方面最多提高了分类准确性,并提高了三倍。这些结果展示了Trace获得与人类行为有关的各种数据的潜力。
translated by 谷歌翻译
3D多对象跟踪(MOT)是自动驾驶汽车的关键问题,需要在动态环境中执行信息良好的运动计划。特别是对于密集的占领场景,将现有曲目与新检测相关联仍然具有挑战性,因为现有系统倾向于省略关键的上下文信息。我们提出的解决方案InterTrack引入了3D MOT的相互作用变压器,以生成数据关联的区分对象表示。我们为每个轨道和检测提取状态和形状特征,并通过注意力有效地汇总全局信息。然后,我们对每个轨道/检测功能对进行学习的回归以估计亲和力,并使用强大的两阶段数据关联和轨道管理方法来生成最终轨道。我们在Nuscenes 3D MOT基准上验证了我们的方法,在那里我们观察到了显着的改进,尤其是在物理大小和聚类对象的类别上。从提交开始时,InterTrack在使用CenterPoint检测的方法中排名第1位AMOTA。
translated by 谷歌翻译
作为网络防御的重要工具,欺骗正在迅速发展,并补充了现有的周边安全措施,以迅速检测出漏洞和数据盗窃。限制欺骗使用的因素之一是手工生成逼真的人工制品的成本。但是,机器学习的最新进展为可扩展的,自动化的现实欺骗创造了机会。本愿景论文描述了开发模型所涉及的机会和挑战,以模仿IT堆栈的许多共同元素以造成欺骗效应。
translated by 谷歌翻译
工程方法集中在传统的分解和重构概念上,这些概念依赖于分区组件的输入和输出,以允许组成后的组件级属性。但是,在人工智能(AI)中,通常期望系统会影响其环境,并通过环境影响自己。因此,目前尚不清楚AI系统的输入是否将独立于其输出,因此,是否可以将AI系统视为传统组件。本文认为,工程通用智能需要新的通用系统戒律,称为核心和外围,并探索其理论用途。使用抽象系统理论和必要品种定律详细阐述了新的戒律。通过使用呈现的材料,工程师可以更好地理解调节AI结果以满足利益相关者需求的总体特征,以及实施方案的一般系统性质如何挑战传统工程实践。
translated by 谷歌翻译
转移学习,多任务学习和元学习是关于跨学习任务的知识的概括,与一般智能密切相关。但是,在文献中,它们之间的形式,正式的系统差异并没有得到充实。缺乏系统级形式主义导致在协调相关的跨学科工程工作方面遇到困难。该手稿将转移学习,多任务学习和元学习形式化为抽象学习系统,与正式的最小主义摘要系统理论一致。此外,它使用提出的形式主义来将三个学习的概念从组成,等级和结构同态的角度联系起来。从投入输出系统方面很容易地描绘了发现,强调了划定传输,多任务和元学习之间正式的一般系统差异的便利性。
translated by 谷歌翻译
机器学习(ML)研究通常集中在模型上,而最突出的数据集已用于日常的ML任务,而不考虑这些数据集对基本问题的广度,困难和忠诚。忽略数据集的基本重要性已引起了重大问题,该问题涉及现实世界中的数据级联以及数据集驱动标准的模型质量饱和,并阻碍了研究的增长。为了解决此问题,我们提出Dataperf,这是用于评估ML数据集和数据集工作算法的基准软件包。我们打算启用“数据棘轮”,其中培训集将有助于评估相同问题的测试集,反之亦然。这种反馈驱动的策略将产生一个良性的循环,该循环将加速以数据为中心的AI。MLCommons协会将维护Dataperf。
translated by 谷歌翻译
在各种设备上部署深度学习模型已成为一个重要的话题。硬件专业化的浪潮为多维张量计算带来了一套多样化的加速度原始图。这些新的加速原始基原料以及新兴的机器学习模型带来了巨大的工程挑战。在本文中,我们提出了Tensorir,这是一种编译器抽象,用于通过这些张量计算原始素优化程序。Tensorir概括了现有机器学习编译器中使用的循环巢表示,以将张量计算作为一流的公民。最后,我们在抽象之上构建了一个端到端框架,以自动优化给定的张量计算原始图的深度学习模型。实验结果表明,Tensorir编译会自动使用给定硬件后端的张量计算原始图,并提供与跨平台的最新手工精制系统竞争性能的性能。
translated by 谷歌翻译
荧光显微镜是一直是观察胚胎(体内)生长的长期成像随时间的重要工具。然而,累积暴露是对如此敏感的实时样本的光毒性。虽然像光片荧光显微镜(LSFM)这样的技术允许减少曝光,但它不太适用于深度成像模型。其他计算技术是计算昂贵的并且通常缺乏恢复质量。为了解决这一挑战,可以使用各种低剂量成像技术来实现使用轴向(Z轴)的少量切片实现3D体积重建;但是,它们通常缺乏恢复质量。而且,在轴向上获取致密图像(具有小步骤)是计算昂贵的。为了解决这一挑战,我们介绍了一种基于压缩的感测(CS)方法来完全重建具有相同信噪比(SNR)的3D卷,其具有小于励磁剂量的一半。我们展示了该理论并通过实验验证了这种方法。为了证明我们的技术,我们在斑马鱼胚脊髓(30um厚度)中捕获RFP标记神经元的3D体积,使用共聚焦显微镜轴向采样0.1um。从结果中,我们观察到基于CS的方法从整个堆叠光学部分的小于20%的高于20%实现精确的3D体积重建。在该工作中的开发的基于CS的方法可以容易地应用于其他深度成像模态,例如双光子和光板显微镜,其中还原样品毒性是一个关键挑战。
translated by 谷歌翻译